2025 iThome 鐵人賽
分享至
HyDE 的全名是 Hypothetical Document Embeddings,直譯為「假想文件嵌入」。基本概念是:在檢索之前,不是直接拿 Query 去查資料,而是先利用大型語言模型(LLM)生成一份「假想文件」,再將這份文件嵌入(Embedding)到向量空間中,用來檢索資料庫。
先寫一篇「腦中假想的答案」,這份答案雖然不一定正確,但會含有更多的上下文與語意線索,而引導檢索系統找到更精準的結果。
若與傳統 RAG 對照,HyDE 的流程多了一步「生成假想文件」:
IT邦幫忙